FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE5434, 331 aa
1>>>pF1KE5434 331 - 331 aa - 331 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.9363+/-0.000696; mu= 13.6697+/- 0.042
mean_var=77.2937+/-15.360, 0's: 0 Z-trim(110.9): 19 B-trim: 0 in 0/51
Lambda= 0.145882
statistics sampled from 11966 (11981) to 11966 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.729), E-opt: 0.2 (0.368), width: 16
Scan time: 2.470
The best scores are: opt bits E(32554)
CCDS43741.1 UBXN2B gene_id:137886|Hs108|chr8 ( 331) 2162 463.9 8e-131
CCDS83297.1 UBXN2B gene_id:137886|Hs108|chr8 ( 196) 1195 260.3 9.3e-70
CCDS13015.1 NSFL1C gene_id:55968|Hs108|chr20 ( 370) 1031 225.9 4e-59
CCDS56175.1 NSFL1C gene_id:55968|Hs108|chr20 ( 372) 1024 224.4 1.1e-58
CCDS13016.1 NSFL1C gene_id:55968|Hs108|chr20 ( 339) 839 185.5 5.4e-47
CCDS1704.1 UBXN2A gene_id:165324|Hs108|chr2 ( 259) 495 113.0 2.6e-25
>>CCDS43741.1 UBXN2B gene_id:137886|Hs108|chr8 (331 aa)
initn: 2162 init1: 2162 opt: 2162 Z-score: 2462.2 bits: 463.9 E(32554): 8e-131
Smith-Waterman score: 2162; 100.0% identity (100.0% similar) in 331 aa overlap (1-331:1-331)
10 20 30 40 50 60
pF1KE5 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYEDEVKCKSSKSNRPKATVFKSPRTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYEDEVKCKSSKSNRPKATVFKSPRTP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 PQRFYSSEHEYSGLNIVRPSTGKIVNELFKEAREHGAVPLNEATRASGDDKSKSFTGGGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PQRFYSSEHEYSGLNIVRPSTGKIVNELFKEAREHGAVPLNEATRASGDDKSKSFTGGGY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 RLGSSFCKRSEYIYGENQLQDVQILLKLWSNGFSLDDGELRPYNEPTNAQFLESVKRGEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RLGSSFCKRSEYIYGENQLQDVQILLKLWSNGFSLDDGELRPYNEPTNAQFLESVKRGEI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 PLELQRLVHGGQVNLDMEDHQDQEYIKPRLRFKAFSGEGQKLGSLTPEIVSTPSSPEEED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PLELQRLVHGGQVNLDMEDHQDQEYIKPRLRFKAFSGEGQKLGSLTPEIVSTPSSPEEED
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 KSILNAVVLIDDSVPTTKIQIRLADGSRLIQRFNSTHRILDVRNFIVQSRPEFAALDFIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KSILNAVVLIDDSVPTTKIQIRLADGSRLIQRFNSTHRILDVRNFIVQSRPEFAALDFIL
250 260 270 280 290 300
310 320 330
pF1KE5 VTSFPNKELTDESLTLLEADILNTVLLQQLK
:::::::::::::::::::::::::::::::
CCDS43 VTSFPNKELTDESLTLLEADILNTVLLQQLK
310 320 330
>>CCDS83297.1 UBXN2B gene_id:137886|Hs108|chr8 (196 aa)
initn: 1195 init1: 1195 opt: 1195 Z-score: 1365.8 bits: 260.3 E(32554): 9.3e-70
Smith-Waterman score: 1195; 100.0% identity (100.0% similar) in 178 aa overlap (1-178:1-178)
10 20 30 40 50 60
pF1KE5 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYEDEVKCKSSKSNRPKATVFKSPRTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYEDEVKCKSSKSNRPKATVFKSPRTP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 PQRFYSSEHEYSGLNIVRPSTGKIVNELFKEAREHGAVPLNEATRASGDDKSKSFTGGGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 PQRFYSSEHEYSGLNIVRPSTGKIVNELFKEAREHGAVPLNEATRASGDDKSKSFTGGGY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 RLGSSFCKRSEYIYGENQLQDVQILLKLWSNGFSLDDGELRPYNEPTNAQFLESVKRGEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 RLGSSFCKRSEYIYGENQLQDVQILLKLWSNGFSLDDGELRPYNEPTNAQFLESVKRGVT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 PLELQRLVHGGQVNLDMEDHQDQEYIKPRLRFKAFSGEGQKLGSLTPEIVSTPSSPEEED
CCDS83 LIACMPEIQQLMLEIF
190
>>CCDS13015.1 NSFL1C gene_id:55968|Hs108|chr20 (370 aa)
initn: 1011 init1: 486 opt: 1031 Z-score: 1175.0 bits: 225.9 E(32554): 4e-59
Smith-Waterman score: 1042; 48.9% identity (75.4% similar) in 354 aa overlap (10-330:17-369)
10 20 30 40
pF1KE5 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYED-----------EVKCK
: .: :. .. :::.::: .::: . .
CCDS13 MAAERQEALREFVAVTGAEEDRARFFLESAGWDLQIALASFYEDGGDEDIVTISQATPSS
10 20 30 40 50 60
50 60 70 80
pF1KE5 SSKSNRP---KATVFKS---------PRTPPQRFYSSEHEYSGLNIVRP----STGKIVN
:... : ..: :.. . ::::.. : :: .:: : : ...:.
CCDS13 VSRGTAPSDNRVTSFRDLIHDQDEDEEEEEGQRFYAGGSERSGQQIVGPPRKKSPNELVD
70 80 90 100 110 120
90 100 110 120 130 140
pF1KE5 ELFKEAREHGAVPLNEATRASGD-DKSKSFTGGGYRLGSSFCKRSEYIYGENQL---QDV
.::: :.::::: ....:.. :. .: . :.:::::::.. ..: :. ::.. :::
CCDS13 DLFKGAKEHGAVAVERVTKSPGETSKPRPFAGGGYRLGAAPEEESAYVAGEKRQHSSQDV
130 140 150 160 170 180
150 160 170 180 190 200
pF1KE5 QILLKLWSNGFSLDDGELRPYNEPTNAQFLESVKRGEIPLELQRLVHGGQVNLDMEDHQD
...::::..:::::.:::: :..:.:::::::..:::.: ::.::.::::::::::::.:
CCDS13 HVVLKLWKSGFSLDNGELRSYQDPSNAQFLESIRRGEVPAELRRLAHGGQVNLDMEDHRD
190 200 210 220 230 240
210 220 230 240 250 260
pF1KE5 QEYIKPRLRFKAFSGEGQKLGSLTPEIVSTPSSPEE--EDKSILNAVVLIDDSVPTTKIQ
....::. ::::.:::::::: .:...:: ::: . :... .. .:::.: :::.::
CCDS13 EDFVKPKGAFKAFTGEGQKLGSTAPQVLST-SSPAQQAENEAKASSSILIDESEPTTNIQ
250 260 270 280 290
270 280 290 300 310 320
pF1KE5 IRLADGSRLIQRFNSTHRILDVRNFIVQSRPEFAALDFILVTSFPNKELTDESLTLLEAD
::::::.::.:.:: .::: :.: :::..:: .:: .:::.:.::::::.::: :: ::.
CCDS13 IRLADGGRLVQKFNHSHRISDIRLFIVDARPAMAATSFILMTTFPNKELADESQTLKEAN
300 310 320 330 340 350
330
pF1KE5 ILNTVLLQQLK
.::.:..:.:
CCDS13 LLNAVIVQRLT
360 370
>>CCDS56175.1 NSFL1C gene_id:55968|Hs108|chr20 (372 aa)
initn: 1004 init1: 486 opt: 1024 Z-score: 1167.0 bits: 224.4 E(32554): 1.1e-58
Smith-Waterman score: 1029; 48.3% identity (75.0% similar) in 356 aa overlap (10-330:17-371)
10 20 30 40
pF1KE5 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYED-----------EVKCK
: .: :. .. :::.::: .::: . .
CCDS56 MAAERQEALREFVAVTGAEEDRARFFLESAGWDLQIALASFYEDGGDEDIVTISQATPSS
10 20 30 40 50 60
50 60 70 80
pF1KE5 SSKSNRP---KATVFKS-----------PRTPPQRFYSSEHEYSGLNIVRP----STGKI
:... : ..: :.. . .:::.. : :: .:: : : ...
CCDS56 VSRGTAPSDNRVTSFRDLIHDQDEDEEEEEGQRSRFYAGGSERSGQQIVGPPRKKSPNEL
70 80 90 100 110 120
90 100 110 120 130 140
pF1KE5 VNELFKEAREHGAVPLNEATRASGD-DKSKSFTGGGYRLGSSFCKRSEYIYGENQL---Q
:..::: :.::::: ....:.. :. .: . :.:::::::.. ..: :. ::.. :
CCDS56 VDDLFKGAKEHGAVAVERVTKSPGETSKPRPFAGGGYRLGAAPEEESAYVAGEKRQHSSQ
130 140 150 160 170 180
150 160 170 180 190 200
pF1KE5 DVQILLKLWSNGFSLDDGELRPYNEPTNAQFLESVKRGEIPLELQRLVHGGQVNLDMEDH
::...::::..:::::.:::: :..:.:::::::..:::.: ::.::.::::::::::::
CCDS56 DVHVVLKLWKSGFSLDNGELRSYQDPSNAQFLESIRRGEVPAELRRLAHGGQVNLDMEDH
190 200 210 220 230 240
210 220 230 240 250
pF1KE5 QDQEYIKPRLRFKAFSGEGQKLGSLTPEIVSTPSSPEE--EDKSILNAVVLIDDSVPTTK
.:....::. ::::.:::::::: .:...:: ::: . :... .. .:::.: :::.
CCDS56 RDEDFVKPKGAFKAFTGEGQKLGSTAPQVLST-SSPAQQAENEAKASSSILIDESEPTTN
250 260 270 280 290
260 270 280 290 300 310
pF1KE5 IQIRLADGSRLIQRFNSTHRILDVRNFIVQSRPEFAALDFILVTSFPNKELTDESLTLLE
::::::::.::.:.:: .::: :.: :::..:: .:: .:::.:.::::::.::: :: :
CCDS56 IQIRLADGGRLVQKFNHSHRISDIRLFIVDARPAMAATSFILMTTFPNKELADESQTLKE
300 310 320 330 340 350
320 330
pF1KE5 ADILNTVLLQQLK
:..::.:..:.:
CCDS56 ANLLNAVIVQRLT
360 370
>>CCDS13016.1 NSFL1C gene_id:55968|Hs108|chr20 (339 aa)
initn: 976 init1: 482 opt: 839 Z-score: 957.2 bits: 185.5 E(32554): 5.4e-47
Smith-Waterman score: 899; 45.4% identity (69.7% similar) in 350 aa overlap (10-330:17-338)
10 20 30 40
pF1KE5 MAEGGGPEPGEQERRSSGPRPPSARDLQLALAELYED-----------EVKCK
: .: :. .. :::.::: .::: . .
CCDS13 MAAERQEALREFVAVTGAEEDRARFFLESAGWDLQIALASFYEDGGDEDIVTISQATPSS
10 20 30 40 50 60
50 60 70 80
pF1KE5 SSKSNRP---KATVFKS---------PRTPPQRFYSSEHEYSGLNIVRP----STGKIVN
:... : ..: :.. . ::::.. : :: .:: : : ...:.
CCDS13 VSRGTAPSDNRVTSFRDLIHDQDEDEEEEEGQRFYAGGSERSGQQIVGPPRKKSPNELVD
70 80 90 100 110 120
90 100 110 120 130 140
pF1KE5 ELFKEAREHGAVPLNEATRASGDDKSKSFTGGGYRLGSSFCKRSEYIYGENQLQDVQILL
.::: :.::::: ....:.. : :.. :...:
CCDS13 DLFKGAKEHGAVAVERVTKSPG---------------------------ETSKPRVHVVL
130 140 150
150 160 170 180 190 200
pF1KE5 KLWSNGFSLDDGELRPYNEPTNAQFLESVKRGEIPLELQRLVHGGQVNLDMEDHQDQEYI
:::..:::::.:::: :..:.:::::::..:::.: ::.::.::::::::::::.:....
CCDS13 KLWKSGFSLDNGELRSYQDPSNAQFLESIRRGEVPAELRRLAHGGQVNLDMEDHRDEDFV
160 170 180 190 200 210
210 220 230 240 250 260
pF1KE5 KPRLRFKAFSGEGQKLGSLTPEIVSTPSSPEE--EDKSILNAVVLIDDSVPTTKIQIRLA
::. ::::.:::::::: .:...:: ::: . :... .. .:::.: :::.::::::
CCDS13 KPKGAFKAFTGEGQKLGSTAPQVLST-SSPAQQAENEAKASSSILIDESEPTTNIQIRLA
220 230 240 250 260 270
270 280 290 300 310 320
pF1KE5 DGSRLIQRFNSTHRILDVRNFIVQSRPEFAALDFILVTSFPNKELTDESLTLLEADILNT
::.::.:.:: .::: :.: :::..:: .:: .:::.:.::::::.::: :: ::..::.
CCDS13 DGGRLVQKFNHSHRISDIRLFIVDARPAMAATSFILMTTFPNKELADESQTLKEANLLNA
280 290 300 310 320 330
330
pF1KE5 VLLQQLK
:..:.:
CCDS13 VIVQRLT
>>CCDS1704.1 UBXN2A gene_id:165324|Hs108|chr2 (259 aa)
initn: 446 init1: 211 opt: 495 Z-score: 567.8 bits: 113.0 E(32554): 2.6e-25
Smith-Waterman score: 495; 39.6% identity (74.3% similar) in 202 aa overlap (130-331:49-248)
100 110 120 130 140 150
pF1KE5 LNEATRASGDDKSKSFTGGGYRLGSSFCKRSEYIYGENQLQDVQILLKLWSNGFSLDDGE
:. . .: ..:.. .:::.:::...: .
CCDS17 GSDNQPLGNNQQSNCEYFVDSLFEEAQKVSSKCVSPAEQKKQVDVNIKLWKNGFTVND-D
20 30 40 50 60 70
160 170 180 190 200 210
pF1KE5 LRPYNEPTNAQFLESVKRGEIPLELQRLVHGGQVNLDMEDHQDQEYIKPRLRFKAFSGEG
.: :.. .. :::.:.:.::.: ::: . .:.. .::.... .. . :. :::.:
CCDS17 FRSYSDGASQQFLNSIKKGELPSELQGIFDKEEVDVKVEDKKNEICLSTKPVFQPFSGQG
80 90 100 110 120 130
220 230 240 250 260 270
pF1KE5 QKLGSLTPEIVSTPSSPEEEDKSILNAVVLIDDSVPTTKIQIRLADGSRLIQRFNSTHRI
..::: ::.::: .. : :.:. :.:: : .. : :.::: ::.:.:..:.:: :::.
CCDS17 HRLGSATPKIVSKAKNIEVENKNNLSAVPL-NNLEPITNIQIWLANGKRIVQKFNITHRV
140 150 160 170 180 190
280 290 300 310 320 330
pF1KE5 LDVRNFIVQSRPEFAALDFILVTSFPNKELTDESLTLLEADILNTVLLQQLK
...:: . . . : :.:..: .: ::.::: :::. :.:..:.:.
CCDS17 SHIKDFIEKYQGSQRSPPFSLATALPVLRLLDETLTLEEADLQNAVIIQRLQKTASFREL
200 210 220 230 240 250
CCDS17 SEH
331 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 00:43:58 2016 done: Tue Nov 8 00:43:59 2016
Total Scan time: 2.470 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]