FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5434, 331 aa 1>>>pF1KE5434 331 - 331 aa - 331 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9363+/-0.000696; mu= 13.6697+/- 0.042 mean_var=77.2937+/-15.360, 0's: 0 Z-trim(110.9): 19 B-trim: 0 in 0/51 Lambda= 0.145882 statistics sampled from 11966 (11981) to 11966 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.729), E-opt: 0.2 (0.368), width: 16 Scan time: 2.470 The best scores are: opt bits E(32554) CCDS43741.1 UBXN2B gene_id:137886|Hs108|chr8 ( 331) 2162 463.9 8e-131 CCDS83297.1 UBXN2B gene_id:137886|Hs108|chr8 ( 196) 1195 260.3 9.3e-70 CCDS13015.1 NSFL1C gene_id:55968|Hs108|chr20 ( 370) 1031 225.9 4e-59 CCDS56175.1 NSFL1C gene_id:55968|Hs108|chr20 ( 372) 1024 224.4 1.1e-58 CCDS13016.1 NSFL1C gene_id:55968|Hs108|chr20 ( 339) 839 185.5 5.4e-47 CCDS1704.1 UBXN2A gene_id:165324|Hs108|chr2 ( 259) 495 113.0 2.6e-25 >>CCDS43741.1 UBXN2B gene_id:137886|Hs108|chr8 (331 aa) initn: 2162 init1: 2162 opt: 2162 Z-score: 2462.2 bits: 463.9 E(32554): 8e-131 Smith-Waterman score: 2162; 100.0% identity (100.0% similar) in 331 aa overlap (1-331:1-331) 10 20 30 40 50 60 pF1KE5 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYEDEVKCKSSKSNRPKATVFKSPRTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYEDEVKCKSSKSNRPKATVFKSPRTP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 PQRFYSSEHEYSGLNIVRPSTGKIVNELFKEAREHGAVPLNEATRASGDDKSKSFTGGGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PQRFYSSEHEYSGLNIVRPSTGKIVNELFKEAREHGAVPLNEATRASGDDKSKSFTGGGY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 RLGSSFCKRSEYIYGENQLQDVQILLKLWSNGFSLDDGELRPYNEPTNAQFLESVKRGEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 RLGSSFCKRSEYIYGENQLQDVQILLKLWSNGFSLDDGELRPYNEPTNAQFLESVKRGEI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 PLELQRLVHGGQVNLDMEDHQDQEYIKPRLRFKAFSGEGQKLGSLTPEIVSTPSSPEEED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PLELQRLVHGGQVNLDMEDHQDQEYIKPRLRFKAFSGEGQKLGSLTPEIVSTPSSPEEED 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 KSILNAVVLIDDSVPTTKIQIRLADGSRLIQRFNSTHRILDVRNFIVQSRPEFAALDFIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KSILNAVVLIDDSVPTTKIQIRLADGSRLIQRFNSTHRILDVRNFIVQSRPEFAALDFIL 250 260 270 280 290 300 310 320 330 pF1KE5 VTSFPNKELTDESLTLLEADILNTVLLQQLK ::::::::::::::::::::::::::::::: CCDS43 VTSFPNKELTDESLTLLEADILNTVLLQQLK 310 320 330 >>CCDS83297.1 UBXN2B gene_id:137886|Hs108|chr8 (196 aa) initn: 1195 init1: 1195 opt: 1195 Z-score: 1365.8 bits: 260.3 E(32554): 9.3e-70 Smith-Waterman score: 1195; 100.0% identity (100.0% similar) in 178 aa overlap (1-178:1-178) 10 20 30 40 50 60 pF1KE5 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYEDEVKCKSSKSNRPKATVFKSPRTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYEDEVKCKSSKSNRPKATVFKSPRTP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 PQRFYSSEHEYSGLNIVRPSTGKIVNELFKEAREHGAVPLNEATRASGDDKSKSFTGGGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 PQRFYSSEHEYSGLNIVRPSTGKIVNELFKEAREHGAVPLNEATRASGDDKSKSFTGGGY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 RLGSSFCKRSEYIYGENQLQDVQILLKLWSNGFSLDDGELRPYNEPTNAQFLESVKRGEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 RLGSSFCKRSEYIYGENQLQDVQILLKLWSNGFSLDDGELRPYNEPTNAQFLESVKRGVT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 PLELQRLVHGGQVNLDMEDHQDQEYIKPRLRFKAFSGEGQKLGSLTPEIVSTPSSPEEED CCDS83 LIACMPEIQQLMLEIF 190 >>CCDS13015.1 NSFL1C gene_id:55968|Hs108|chr20 (370 aa) initn: 1011 init1: 486 opt: 1031 Z-score: 1175.0 bits: 225.9 E(32554): 4e-59 Smith-Waterman score: 1042; 48.9% identity (75.4% similar) in 354 aa overlap (10-330:17-369) 10 20 30 40 pF1KE5 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYED-----------EVKCK : .: :. .. :::.::: .::: . . CCDS13 MAAERQEALREFVAVTGAEEDRARFFLESAGWDLQIALASFYEDGGDEDIVTISQATPSS 10 20 30 40 50 60 50 60 70 80 pF1KE5 SSKSNRP---KATVFKS---------PRTPPQRFYSSEHEYSGLNIVRP----STGKIVN :... : ..: :.. . ::::.. : :: .:: : : ...:. CCDS13 VSRGTAPSDNRVTSFRDLIHDQDEDEEEEEGQRFYAGGSERSGQQIVGPPRKKSPNELVD 70 80 90 100 110 120 90 100 110 120 130 140 pF1KE5 ELFKEAREHGAVPLNEATRASGD-DKSKSFTGGGYRLGSSFCKRSEYIYGENQL---QDV .::: :.::::: ....:.. :. .: . :.:::::::.. ..: :. ::.. ::: CCDS13 DLFKGAKEHGAVAVERVTKSPGETSKPRPFAGGGYRLGAAPEEESAYVAGEKRQHSSQDV 130 140 150 160 170 180 150 160 170 180 190 200 pF1KE5 QILLKLWSNGFSLDDGELRPYNEPTNAQFLESVKRGEIPLELQRLVHGGQVNLDMEDHQD ...::::..:::::.:::: :..:.:::::::..:::.: ::.::.::::::::::::.: CCDS13 HVVLKLWKSGFSLDNGELRSYQDPSNAQFLESIRRGEVPAELRRLAHGGQVNLDMEDHRD 190 200 210 220 230 240 210 220 230 240 250 260 pF1KE5 QEYIKPRLRFKAFSGEGQKLGSLTPEIVSTPSSPEE--EDKSILNAVVLIDDSVPTTKIQ ....::. ::::.:::::::: .:...:: ::: . :... .. .:::.: :::.:: CCDS13 EDFVKPKGAFKAFTGEGQKLGSTAPQVLST-SSPAQQAENEAKASSSILIDESEPTTNIQ 250 260 270 280 290 270 280 290 300 310 320 pF1KE5 IRLADGSRLIQRFNSTHRILDVRNFIVQSRPEFAALDFILVTSFPNKELTDESLTLLEAD ::::::.::.:.:: .::: :.: :::..:: .:: .:::.:.::::::.::: :: ::. CCDS13 IRLADGGRLVQKFNHSHRISDIRLFIVDARPAMAATSFILMTTFPNKELADESQTLKEAN 300 310 320 330 340 350 330 pF1KE5 ILNTVLLQQLK .::.:..:.: CCDS13 LLNAVIVQRLT 360 370 >>CCDS56175.1 NSFL1C gene_id:55968|Hs108|chr20 (372 aa) initn: 1004 init1: 486 opt: 1024 Z-score: 1167.0 bits: 224.4 E(32554): 1.1e-58 Smith-Waterman score: 1029; 48.3% identity (75.0% similar) in 356 aa overlap (10-330:17-371) 10 20 30 40 pF1KE5 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYED-----------EVKCK : .: :. .. :::.::: .::: . . CCDS56 MAAERQEALREFVAVTGAEEDRARFFLESAGWDLQIALASFYEDGGDEDIVTISQATPSS 10 20 30 40 50 60 50 60 70 80 pF1KE5 SSKSNRP---KATVFKS-----------PRTPPQRFYSSEHEYSGLNIVRP----STGKI :... : ..: :.. . .:::.. : :: .:: : : ... CCDS56 VSRGTAPSDNRVTSFRDLIHDQDEDEEEEEGQRSRFYAGGSERSGQQIVGPPRKKSPNEL 70 80 90 100 110 120 90 100 110 120 130 140 pF1KE5 VNELFKEAREHGAVPLNEATRASGD-DKSKSFTGGGYRLGSSFCKRSEYIYGENQL---Q :..::: :.::::: ....:.. :. .: . :.:::::::.. ..: :. ::.. : CCDS56 VDDLFKGAKEHGAVAVERVTKSPGETSKPRPFAGGGYRLGAAPEEESAYVAGEKRQHSSQ 130 140 150 160 170 180 150 160 170 180 190 200 pF1KE5 DVQILLKLWSNGFSLDDGELRPYNEPTNAQFLESVKRGEIPLELQRLVHGGQVNLDMEDH ::...::::..:::::.:::: :..:.:::::::..:::.: ::.::.:::::::::::: CCDS56 DVHVVLKLWKSGFSLDNGELRSYQDPSNAQFLESIRRGEVPAELRRLAHGGQVNLDMEDH 190 200 210 220 230 240 210 220 230 240 250 pF1KE5 QDQEYIKPRLRFKAFSGEGQKLGSLTPEIVSTPSSPEE--EDKSILNAVVLIDDSVPTTK .:....::. ::::.:::::::: .:...:: ::: . :... .. .:::.: :::. CCDS56 RDEDFVKPKGAFKAFTGEGQKLGSTAPQVLST-SSPAQQAENEAKASSSILIDESEPTTN 250 260 270 280 290 260 270 280 290 300 310 pF1KE5 IQIRLADGSRLIQRFNSTHRILDVRNFIVQSRPEFAALDFILVTSFPNKELTDESLTLLE ::::::::.::.:.:: .::: :.: :::..:: .:: .:::.:.::::::.::: :: : CCDS56 IQIRLADGGRLVQKFNHSHRISDIRLFIVDARPAMAATSFILMTTFPNKELADESQTLKE 300 310 320 330 340 350 320 330 pF1KE5 ADILNTVLLQQLK :..::.:..:.: CCDS56 ANLLNAVIVQRLT 360 370 >>CCDS13016.1 NSFL1C gene_id:55968|Hs108|chr20 (339 aa) initn: 976 init1: 482 opt: 839 Z-score: 957.2 bits: 185.5 E(32554): 5.4e-47 Smith-Waterman score: 899; 45.4% identity (69.7% similar) in 350 aa overlap (10-330:17-338) 10 20 30 40 pF1KE5 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYED-----------EVKCK : .: :. .. :::.::: .::: . . CCDS13 MAAERQEALREFVAVTGAEEDRARFFLESAGWDLQIALASFYEDGGDEDIVTISQATPSS 10 20 30 40 50 60 50 60 70 80 pF1KE5 SSKSNRP---KATVFKS---------PRTPPQRFYSSEHEYSGLNIVRP----STGKIVN :... : ..: :.. . ::::.. : :: .:: : : ...:. CCDS13 VSRGTAPSDNRVTSFRDLIHDQDEDEEEEEGQRFYAGGSERSGQQIVGPPRKKSPNELVD 70 80 90 100 110 120 90 100 110 120 130 140 pF1KE5 ELFKEAREHGAVPLNEATRASGDDKSKSFTGGGYRLGSSFCKRSEYIYGENQLQDVQILL .::: :.::::: ....:.. : :.. :...: CCDS13 DLFKGAKEHGAVAVERVTKSPG---------------------------ETSKPRVHVVL 130 140 150 150 160 170 180 190 200 pF1KE5 KLWSNGFSLDDGELRPYNEPTNAQFLESVKRGEIPLELQRLVHGGQVNLDMEDHQDQEYI :::..:::::.:::: :..:.:::::::..:::.: ::.::.::::::::::::.:.... CCDS13 KLWKSGFSLDNGELRSYQDPSNAQFLESIRRGEVPAELRRLAHGGQVNLDMEDHRDEDFV 160 170 180 190 200 210 210 220 230 240 250 260 pF1KE5 KPRLRFKAFSGEGQKLGSLTPEIVSTPSSPEE--EDKSILNAVVLIDDSVPTTKIQIRLA ::. ::::.:::::::: .:...:: ::: . :... .. .:::.: :::.:::::: CCDS13 KPKGAFKAFTGEGQKLGSTAPQVLST-SSPAQQAENEAKASSSILIDESEPTTNIQIRLA 220 230 240 250 260 270 270 280 290 300 310 320 pF1KE5 DGSRLIQRFNSTHRILDVRNFIVQSRPEFAALDFILVTSFPNKELTDESLTLLEADILNT ::.::.:.:: .::: :.: :::..:: .:: .:::.:.::::::.::: :: ::..::. CCDS13 DGGRLVQKFNHSHRISDIRLFIVDARPAMAATSFILMTTFPNKELADESQTLKEANLLNA 280 290 300 310 320 330 330 pF1KE5 VLLQQLK :..:.: CCDS13 VIVQRLT >>CCDS1704.1 UBXN2A gene_id:165324|Hs108|chr2 (259 aa) initn: 446 init1: 211 opt: 495 Z-score: 567.8 bits: 113.0 E(32554): 2.6e-25 Smith-Waterman score: 495; 39.6% identity (74.3% similar) in 202 aa overlap (130-331:49-248) 100 110 120 130 140 150 pF1KE5 LNEATRASGDDKSKSFTGGGYRLGSSFCKRSEYIYGENQLQDVQILLKLWSNGFSLDDGE :. . .: ..:.. .:::.:::...: . CCDS17 GSDNQPLGNNQQSNCEYFVDSLFEEAQKVSSKCVSPAEQKKQVDVNIKLWKNGFTVND-D 20 30 40 50 60 70 160 170 180 190 200 210 pF1KE5 LRPYNEPTNAQFLESVKRGEIPLELQRLVHGGQVNLDMEDHQDQEYIKPRLRFKAFSGEG .: :.. .. :::.:.:.::.: ::: . .:.. .::.... .. . :. :::.: CCDS17 FRSYSDGASQQFLNSIKKGELPSELQGIFDKEEVDVKVEDKKNEICLSTKPVFQPFSGQG 80 90 100 110 120 130 220 230 240 250 260 270 pF1KE5 QKLGSLTPEIVSTPSSPEEEDKSILNAVVLIDDSVPTTKIQIRLADGSRLIQRFNSTHRI ..::: ::.::: .. : :.:. :.:: : .. : :.::: ::.:.:..:.:: :::. CCDS17 HRLGSATPKIVSKAKNIEVENKNNLSAVPL-NNLEPITNIQIWLANGKRIVQKFNITHRV 140 150 160 170 180 190 280 290 300 310 320 330 pF1KE5 LDVRNFIVQSRPEFAALDFILVTSFPNKELTDESLTLLEADILNTVLLQQLK ...:: . . . : :.:..: .: ::.::: :::. :.:..:.:. CCDS17 SHIKDFIEKYQGSQRSPPFSLATALPVLRLLDETLTLEEADLQNAVIIQRLQKTASFREL 200 210 220 230 240 250 CCDS17 SEH 331 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 00:43:58 2016 done: Tue Nov 8 00:43:59 2016 Total Scan time: 2.470 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]